查看原文
其他

Nature系列 | 整合单细胞转录组学和质谱流式确定类风湿性关节炎滑膜组织中的炎症细胞状态 | 详细解读

生信宝典 生信宝典 2022-03-28

To define the cell populations that drive joint inflammation in rheumatoid arthritis (RA), we applied single-cell RNA sequencing (scRNA-seq), mass cytometry, bulk RNA sequencing (RNA-seq) and flow cytometry to T cells, B cells, monocytes, and fibroblasts from 51 samples of synovial tissue from patients with RA or osteoarthritis (OA). Utilizing an integrated strategy based on canonical correlation analysis of 5,265 scRNA-seq profiles, we identified 18 unique cell populations. Combining mass cytometry and transcriptomics revealed cell states expanded in RA synovia: THY1(CD90)+HLA-DRAhi sublining fibroblasts, IL1B+ pro-inflammatory monocytes, ITGAX+TBX21+ autoimmune-associated B cells and PDCD1+ peripheral helper T (TPH) cells and follicular helper T (TFH) cells. We defined distinct subsets of CD8+ T cells characterized by GZMK+, GZMB+, and GNLY+ phenotypes. We mapped inflammatory mediators to their source cell populations; for example, we attributed IL6 expression to THY1+HLA-DRAhi fibroblasts and IL1B production to pro-inflammatory monocytes. These populations are potentially key mediators of RA pathogenesis.

Zhang F, Wei K et al. Defining inflammatory cell states in rheumatoid arthritis joint synovial tissues by integrating single-cell transcriptomics and mass cytometry. Nat Immunol. 2019 May 6. doi: 10.1038

文章解读:Tiger

文章校对:生信宝典

研究背景

类风湿性关节炎(RA)是一种自身免疫性疾病(最近nature发表多篇),在关节组织的滑膜中具有慢性炎症。这种炎症导致关节破坏,残疾和寿命缩短。因此,在炎症组织中寻找关键细胞亚群及其活化状态是定义RA新治疗靶标的关键步骤。先期研究已经发现CD4 + T细胞B细胞单核细胞成纤维细胞已确定与RA发病机理相关。

作者收集和分解来自RA和OA患者的组织样本,然后对组成细胞进行质谱流式,普通流式,scRNA-seq和bulk RNA-seq。 通过在单细胞层面对跨数据模态进行整合,精确定义了特定细胞亚群在RA和慢性炎症中的作用。

研究方案

Sample:滑膜组织,作者招募了36名RA患者,15名OA患者,并从超声引导下的活检中或关节置换获得滑膜组织.

单细胞建库流程+实验设计流程CEL-Seq2 method (下图)

测序数据分析介绍(质谱流式+Bulk RNA-seq+scRNA-seq)

质谱流式+Bulk RNA-seq

  1. 对流式分选的细胞(T cells, B cells, monocytes, and synovial fibroblasts)进行转录组测序;(工具:Illumina MiSeq ;比对:Ensembl version 83 transcripts; 39个转录组分析工具,120种组合评估(转录组分析工具哪家强-导读版)

  2. QC:(1)定义共同基因为在95%的样品有至少一条reads支持;(2)共同基因占比少于99%的样本定义为低质量样本在后续分析中将被剔除;

  3. 共获得167个高质量样本,包括45 fibroblast samples, 46 monocyte samples, 47 T cell samples, and 29 B cell samples;

  4. 生信宝典注:质谱流式细胞技术(Mass Cytometry)是利用质谱原理对单细胞进行多参数检测的流式技术。它继承了传统流式细胞仪的高速分析的特点,又具有质谱检测的高分辨能力,是流式细胞技术一个新的发展方向。

scRNA-seq

  1. 方法:CEL-Seq2; 工具:HiSeq 2500;Reads 通过STAR2.5.2b比对到hg19;(基因组版本有些老,NGS基础 - 参考基因组和基因注释文件)

  2. QC:作者发现由少量reads表示的分子更可能是来自其他细胞的污染物分子,所以开发了一种简单的算法来设置每分子最小读数的阈值。We used 2 marker genes expected to be exclusively expressed in each of the four cell types: PDGFRA and ISLR for fibroblasts, CD2 and CD3D for T cells, CD79A and RALGPS2 for B cells, and CD14 and C1QA for monocytes. 然后计算这些基因在该表达的细胞类型中的高于阈值的表达定义为真阳性,在不该表达的细胞类型中的高于阈值的表达定义为假阳性。遍历表达阈值分别为1-20之间的数值,选取能够最大化真阳性/假阳性比值的值为最终阈值。然后作者进行以下条件的筛选:(1)细胞检测到的genes数>1000;(2)线粒体相关基因的表达占比少于25%

质谱流式+scRNA-seq

  1. 作者收集6个富含白细胞、9个白细胞缺乏的RA和11个OA样品用于质谱流式分析;

  2. 双门控通道选定活细胞:B细胞(CD45 + CD3-CD14-CD19 +),成纤维细胞(CD45-PDPN +),单核细胞(CD45 + CD3-CD14 +)和T细胞(CD45 + CD3 + CD14-);

  3. 作者基于CCA分析整合转录组数据和单细胞数据,开发一种基于图的无偏聚类pipeline对单个细胞进行分析;

  1. 质谱流式分群 25161 fibroblasts, 15298 monocytes, 19985 T cells and 8179 B cells;

  2. 分别将质谱流式分群和bulk RNA-seq, scRNA-seq进行关联分析。

结果分析

(1)细胞分群及数据整合;作者利用流式对细胞进行分群后,以bulk RNA-seq作为reference point,利用CCA找到大量RNA-seq样品和scRNA-seq细胞的线性组合,以创建最大相关的基因表达谱。作者使用来自scRNA-seq的最佳标记基因与CCA结果关联,以建立每个scRNA-seq簇与每个质量细胞计数簇之间的关系;(不同测序数据整合分析可能会成为以后分析的一种趋势,nature methods最近发表多篇)

(2)流式定义一部分RA滑膜组织中富含白细胞;组织免疫细胞浸润的变化反映了源关节中的局部疾病活动。作者计算了其它样本与OA的马氏距离,引入最大OA距离作为滑膜中富含白细胞的阈值(> 4.5);为了验证炎症分类的有效性,作者评估了组织学的炎症状态,并且通过Krenn inflammation score (一种炎症评价指标) 对切片上的炎症状态进行评估;

生信宝典注:马氏距离 (Mahalanobis distance)是由印度统计学家马哈拉诺比斯 (P. C. Mahalanobis)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是,它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的),并且是尺度无关的(scale-invariant),即独立于测量尺度。

(3)单细胞分析揭示不同细胞亚型;在5,265个细胞中发现1,142 B cells, 1,844 fibroblasts, 750 monocytes and 1529 T cells (作者在这里说明传统基于PCA的分类batch effect较为明显,所以作者采用CCA-based clustering), 作者共分出来18 cell clusters; 成纤维细胞中,鉴定了四个亚群:CD34 +亚细胞成纤维细胞HLA-DRAhi成纤维细胞DKK3 +成纤维细胞CD55 +lining成纤维细胞; 在单核细胞中, 作者鉴定了IL1B +促炎单核细胞,NUPR1 +单核细胞,C1QA +单核细胞和干扰素(IFN)活化的单核细胞;在T细胞中,鉴定了三个CD4 +簇:CCR7 + T细胞,FOXP3 +调节性T细胞(Treg细胞)和PDCD1 + TPH和TFH细胞;三个CD8 +簇:GZMK + T细胞,GNLY + GZMB +细胞毒性淋巴细胞(CTL)和GZMK + GZMB + T细胞。在B细胞内,鉴定了四个细胞簇,包括幼稚IGHD + CD27-和IGHG3 + CD27 +记忆B细胞,具有高表达ITGAX(也称为CD11c)的自身免疫相关B细胞(ABC)簇和具有高免疫球蛋白基因表达和XBP1的浆母细胞簇;(作者的细胞分型是比较符合免疫分型的,大家也可以采用以上marker对免疫细胞进行亚分型,不建议完全参照某一篇文章定义所有细胞分型

(4)由细胞因子激活和MHC II表达定义不同的滑膜成纤维细胞;在Bulk seq中,与OA相比,leukocyte-rich RA中HLA-DRAhi细胞 HLA,IL6的表达情况更为明显,且在GO富集中,与MHC classII提呈和干扰素信号通路有关;然后作者通过scRNA seq 验证了该观点。(这个只需一步就可做富集分析的网站还未发表就被CNS等引用超过350次

(5)激活状态定义了滑膜单核细胞的异质性;在来自患有白细胞丰富的RA和OA的个体的大量RNA-seq单核细胞样品中,作者发现与IL1B +单核细胞相关的基因,包括NR4A2,HBEGF,PLAUR和IFN激活的基因IFITM3显着在富含白细胞的RA样品中上调。相反,与富含白细胞的RA相比,与NUPR1 +单核细胞(SC-M2)相关的标记基因下调。作者取每个单核细胞scRNA-seq子集的top标记基因(AUC> 0.7),并在bulk seq中测试gene在RA与OA RNA-seq数据中的差异表达。

作者发现富含白细胞的RA滑膜与OA相比具有更大的IL1B +单核细胞和IFN激活的单细胞丰度,但更低NUPR1 +单核细胞的丰度。这些数据表明细胞因子激活驱动活动性RA滑膜中独特单核细胞群的扩增。利用基因组富集分析(GSEA),作者测试了MSigDB(分子特征数据库)免疫基因组,发现IL1B +单核细胞(SC-M1)脂多糖反应相关基因的表达水平相对较高;(一句话,单核细胞异质性较强)

(6)滑膜CD4和CD8T细胞的异质性;作者在scRNA-seq数据中发现了三个CD4 +和三个CD8 + T细胞亚群(其实作者分出的亚群CD4比较好分,CD8多为exhausted T cell耗竭性基因的表达)鉴定了三个CD4+簇:CCR7 + T细胞,FOXP3 +调节性T细胞(Treg细胞)和PDCD1 + TPH和TFH细胞; 三个CD8 +簇:GZMK + T细胞,GNLY + GZMB +细胞毒性淋巴细胞(CTL)和GZMK + GZMB + T细胞。与OA相比,CXCL13在富含白细胞的OA的TPH细胞中上调表达; 作者通过质谱流式,鉴定出9个T cell clusters, 并通过结合bulk seq发现CXCL13, TIGIT and CTLA4在CD4+PD-1ICOS+cluster中富集;

(7)通过单细胞RNA-seq发现在RA滑膜中自身免疫相关B细胞增加;细胞分型为幼稚B细胞(SC-B1),记忆B细胞(SC-B2),ITGAX + ABC细胞(SC-B3)和浆母细胞(SC-B4);SC-B3细胞表达高水平的ITGAX和TBX21(T-bet),它们是自身免疫相关B细胞的标志物,AICDA的高表达与最近报道的来自系统性红斑狼疮(SLE)样品的外周血的CD11c + B细胞的转录组学分析一致。干扰素刺激的基因(GBP1和ISG15)也在ABCs(SC-B3)中表达并在富含白细胞的RA中上调。质谱流式分型划分10个细胞clusters,进一步分型发现CD11c +细胞内的三个亚组:IgM-IgD-HLA-DR ++ CD20 + CD11c +,CD38 + HLA-DR ++ CD20-CD11c +和IgM + IgD + CD11c +。


(8)通过单细胞分析揭示炎症途径和效应模块; 为了确定与富含白细胞的RA相关的途径,作者使用GO分析鉴定了I型干扰素反应炎症反应(单核细胞和成纤维细胞),Fc受体信号传导(单核细胞),NF-κB信号传导 (成纤维细胞)和干扰素γ(T细胞)。富含白细胞的RA样本在成纤维细胞和单核细胞中具有显着更高的基因表达:炎症反应基因(PTGS2,PTGER3和ICAM1),干扰素应答基因(IFIT2,RSAD2,STAT1和XAF1),以及趋化因子或细胞因子基因(CCL2和CXCL9),与干扰素激活的协同趋化反应一致。 T细胞具有干扰素调节因子(IRF)的上调,包括IRF7和IRF9,并且单核细胞具有IRF7,IRF8和IRF9的上调。Toll样受体信号通路富含白细胞丰富的RA组织中的B细胞和单核细胞。

在单细胞水平,TLR10仅由活化的B细胞表达,表明TLR10在B细胞谱系中具有功能性作用。相反,TLR8在所有RA单核细胞亚群中升高。造血细胞特异性转录因子IRF8在显着部分的单核细胞和B细胞中表达,其协同调节RA滑膜中单核细胞和活化B细胞的分化。 SLAMF7由促炎单核细胞(SC-M1),IFN激活的单核细胞(SC-M4),CD8 + T细胞和浆母细胞(SC-B4)高度表达。

临床意义

(1)该篇文章强调可以将sublining fibroblast作为治疗RA的潜在靶点;(a major source of proinflammatory cytokines)

(2)第一次在富含白细胞的RA中发现自身免疫相关性B细胞;

单细胞文章点评

该文章的亮点在于多种维度的数据进行整合分析,并且开发了CCA-based pipeline, 对每个细胞分群描述的极为详细,符合《nature immunology》一贯“又细又长”的风格;

炎症反应的单细胞方面的文章还处于较少的阶段,该文章做的是类风湿关节炎,还有许多的自身免疫病可以以相同方式进行实验(最关键的是样本获取和money),尤其是有一些自身免疫病可以引发癌症的(前几天有篇胃炎胃癌的单细胞测序)。

炎症反应和病原体结合的文章较少,合理设计实验很重要!(+reporter对病原体进行标记)可以发现病原体和机体的动态互作;

必须将scRNA seq与其它技术进行结合(现在主要是质谱流式和CRISPR),除非你的细胞数真是巨多(我是土豪!)

单细胞系列教程


参考文献

Zhang F, Wei K et al. Defining inflammatory cell states in rheumatoid arthritis joint synovial tissues by integrating single-cell transcriptomics and mass cytometry.Nat Immunol. 2019 May 6. doi: 10.1038

易生信系列培训课程,扫码获取免费资料

更多阅读

画图三字经 生信视频 生信系列教程 

心得体会 TCGA数据库 Linux Python 

高通量分析 免费在线画图 测序历史 超级增强子

生信学习视频 PPT EXCEL 文章写作 ggplot2

海哥组学 可视化套路 基因组浏览器

色彩搭配 图形排版 互作网络

自学生信

后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存